InterSpeech2020 論文読み会より
"An unsupervised method to select a speaker subset from large multi-speaker speech synthesis datasets"https://t.co/ikjwOcYuJh
サブセットで学習したTTSのほうがよくなる選出方法
クラスタリングの際の話者特徴量としてDeep Spectrumが最適— しらいはかせ #VRStudioLab (@o_ob) November 20, 2020
from Twitter https://twitter.com/o_ob